专利摘要:
本發明係參照將用以特定使用檢索詞之使用者之使用者特定資訊、與用以特定使用該檢索詞執行檢索處理之檢索時刻之檢索時刻特定資訊建立關聯而記憶該檢索詞之檢索詞記憶機構(12a),自與同一使用者特定資訊建立關聯之檢索時刻之間隔為特定時間以內之檢索詞,生成按照檢索時刻之順序而將檢索時刻較早的檢索詞與較晚的檢索詞成對之成對檢索詞(S4)。算出於所生成之成對檢索詞中成對檢索詞之第1出現次數(S7),並算出相對於成對檢索詞而使檢索時刻之順序顛倒之倒序成對檢索詞之第2出現次數(S8),於第1出現次數與第2出現次數之大小關係滿足特定條件之情形時,將較早的檢索詞與較晚的檢索詞作為同義詞而記憶(S9、S10)。
公开号:TW201324212A
申请号:TW101129790
申请日:2012-08-16
公开日:2013-06-16
发明作者:Teiko INOUE;Taku YASUI;Kenji Sugiki
申请人:Rakuten Inc;
IPC主号:G06F16-00
专利说明:
資訊處理裝置、資訊處理方法、資訊處理裝置用程式產品及記錄媒體
本發明係關於一種生成辭典之資訊處理裝置、資訊處理方法、資訊處理裝置用程式產品及記錄媒體之技術領域。
於進行檢索處理、或對為檢索而輸入之檢索詞進行轉換處理之情形時,近義詞辭典(同義詞(thesaurus)辭典)較為有用。於網際網路上,不斷地提供新的商品或服務等,因而產生新的詞語。亦必需使此種新的詞語可對應同義詞辭典。例如,於專利文獻1中揭示有如下辭典生成裝置,其以綜合有文件中之特定範圍內之詞語之共現頻度表與將同義詞資訊轉換成假想的頻度表之同義詞頻度表之頻度表為基礎而學習詞語間之關聯性,並壓縮綜合頻度表而製成概念辭典。 [先前技術文獻] [專利文獻]
[專利文獻1]日本專利特開2005-250762號公報
然而,於如專利文獻1之先前技術中,揭示有關於生成同義詞辭典之技術,但有預先提供詞語間之階層構造作為預處理等之人的負擔。
本發明係鑒於上述問題而完成者,其課題之一例之目的在於提供一種根據用於檢索之檢索詞而生成同義詞辭典之資訊處理裝置等。
為解決上述課題,技術方案1之發明之特徵在於包括:成對檢索詞生成機構,其參照將用以特定使用檢索詞之使用者之使用者特定資訊、與用以特定使用該檢索詞執行檢索處理之時刻即檢索時刻的檢索時刻特定資訊建立關聯而記憶該檢索詞之檢索詞記憶機構,自與同一之上述使用者特定資訊建立關聯之上述檢索時刻之間隔為特定時間以內之檢索詞,生成按照上述檢索時刻之順序而將上述檢索時刻較早的檢索詞與較晚的檢索詞成對之成對檢索詞;第1出現次數算出機構,其算出於藉由上述成對檢索詞生成機構而生成之成對檢索詞中特定之成對檢索詞出現之第1出現次數;第2出現次數算出機構,其算出相對於上述特定之成對檢索詞而將檢索時刻之順序顛倒之倒序成對檢索詞出現之第2出現次數;以及記憶機構,其於藉由上述第1及第2出現次數算出機構而算出之第1出現次數與第2出現次數之大小關係滿足特定條件之情形時,將上述較早的檢索詞與較晚的檢索詞作為同義詞而記憶。
技術方案2之發明之特徵在於,於技術方案1之資訊處理裝置中,上述記憶機構於藉由上述第1及第2出現次數算出機構而算出之第1出現次數與第2出現次數之差為特定範圍內之情形時,將上述較早的檢索詞與較晚的檢索詞作為同義詞而記憶。
技術方案3之發明之特徵在於,於技術方案1或2之資訊處理裝置中,上述成對檢索詞生成機構對上述較早的檢索詞及較晚的檢索詞之字符串進行處理而生成上述成對檢索詞。
技術方案4之發明之特徵在於,於技術方案3之資訊處理裝置中,上述成對檢索詞生成機構參照預先記憶有用以自上述檢索詞中刪除特定字符之字符之刪除用字符記憶機構,進行自上述較早的檢索詞及較晚的檢索詞中刪除特定字符之字符串處理而生成上述成對檢索詞。
技術方案5之發明之特徵在於,於技術方案1或2之資訊處理裝置中,上述成對檢索詞生成機構於檢索詞為2個以上、且上述較早的檢索詞與較晚的檢索詞之間具有共同之檢索詞之情形時,自已刪除共同之檢索詞之較早的檢索詞及較晚的檢索詞而生成上述成對檢索詞。
技術方案6之發明之特徵在於,於技術方案1或2之資訊處理裝置中,更包括參照上述檢索詞記憶機構而取得第1檢索詞及第2檢索詞之檢索詞取得機構,且上述記憶機構對藉由上述檢索詞取得機構而取得之第1檢索詞及第2檢索詞之字符串進行處理,當該字符串經處理之第1檢索詞與第2檢索詞之間成立包含關係時,將上述第1檢索詞與第2檢索詞作為同義詞而記憶。
技術方案7之發明之特徵在於,於技術方案6之資訊處理裝置中,上述記憶機構按照藉由上述檢索詞取得機構而取得之第1檢索詞及第2檢索詞之字符串之順序,進行比較該第1及第2檢索詞之各字符之字符串處理而判定包含關係,於該包含關係成立時,將上述第1檢索詞與第2檢索詞作為同義詞而記憶。
技術方案8之發明之特徵在於,於技術方案6之資訊處理裝置中,上述記憶機構參照預先記憶有用以自上述檢索詞中刪除特定字符之字符之刪除用字符記憶機構,對藉由上述檢索詞取得機構而取得之第1檢索詞及第2檢索詞進行刪除特定字符之字符串處理,當已刪除該特定字符之第1檢索詞與第2檢索詞之間成立包含關係時,將上述第1檢索詞與第2檢索詞作為同義詞而記憶。
技術方案9之發明之特徵在於,於技術方案6之資訊處理裝置中,上述記憶機構於檢索詞為2個以上、且上述第1檢索詞與第2檢索詞之間具有共同之檢索詞之情形時,對於已刪除該共同之檢索詞之第1及第2檢索詞,當已刪除上述特定字符時之包含關係成立時,將已刪除上述共同之檢索詞之第1及第2檢索詞作為同義詞而記憶。
技術方案10之發明之特徵在於:於技術方案1或2之資訊處理裝置中,上述記憶機構參照作為上述同義詞而記憶之檢索詞之同義詞資料庫,連同與作為同義詞而記憶之2個檢索詞中之至少一個檢索詞存在同義詞之關係之檢索詞將上述2個檢索詞作為同義詞而記憶。
技術方案11之發明之特徵在於,於進行資訊處理之資訊處理裝置之資訊處理方法中,包含:成對檢索詞生成步驟,參照將用以特定使用檢索詞之使用者之使用者特定資訊、與用以特定使用該檢索詞執行檢索處理之時刻即檢索時刻的檢索時刻特定資訊建立關聯而記憶該檢索詞之檢索詞記憶機構,自與同一之上述使用者特定資訊建立關聯之上述檢索時刻之間隔為特定時間以內之檢索詞,生成按照上述檢索時刻之順序而將上述檢索時刻較早的檢索詞與較晚的檢索詞成對之成對檢索詞;第1出現次數算出步驟,算出於上述成對檢索詞生成步驟中生成之成對檢索詞中特定之成對檢索詞出現之第1出現次數;第2出現次數算出步驟,算出相對於上述特定之成對檢索詞而將檢索時刻之順序顛倒之倒序成對檢索詞出現之第2出現次數;以及記憶步驟,於上述第1及第2出現次數算出步驟中算出之第1出現次數與第2出現次數之大小關係滿足特定條件之情形時,將上述較早的檢索詞與較晚的檢索詞作為同義詞而記憶。
技術方案12之發明之特徵在於使電腦作為如下機構發揮功能:成對檢索詞生成機構,其參照將用以特定使用檢索詞之使用者之使用者特定資訊、與用以特定使用該檢索詞執行檢索處理之時刻即檢索時刻的檢索時刻特定資訊建立關聯而記憶該檢索詞之檢索詞記憶機構,自與同一之上述使用者特定資訊建立關聯之上述檢索時刻之間隔為特定時間以內之檢索詞,生成按照上述檢索時刻之順序而將上述檢索時刻較早的檢索詞與較晚的檢索詞成對之成對檢索詞;第1出現次數算出機構,其算出於藉由上述成對檢索詞生成機構而生成之成對檢索詞中特定之成對檢索詞出現之第1出現次數;第2出現次數算出機構,其算出相對於上述特定之成對檢索詞而將檢索時刻之順序顛倒之倒序成對檢索詞出現之第2出現次數;以及記憶機構,其於藉由上述第1及第2出現次數算出機構而算出之第1出現次數與第2出現次數之大小關係滿足特定條件之情形時,將上述較早的檢索詞與較晚的檢索詞作為同義詞而記憶。
技術方案13之發明係電腦可讀取地記錄有資訊處理裝置用程式,其特徵在於使電腦作為如下機構發揮功能:成對檢索詞生成機構,其參照將用以特定使用檢索詞之使用者之使用者特定資訊、與用以特定使用該檢索詞執行檢索處理之時刻即檢索時刻的檢索時刻特定資訊建立關聯而記憶該檢索詞之檢索詞記憶機構,自與同一之上述使用者特定資訊建立關聯之上述檢索時刻之間隔為特定時間以內之檢索詞,生成按照上述檢索時刻之順序而將上述檢索時刻較早的檢索詞與較晚的檢索詞成對之成對檢索詞;第1出現次數算出機構,其算出於藉由上述成對檢索詞生成機構而生成之成對檢索詞中特定之成對檢索詞出現之第1出現次數;第2出現次數算出機構,其算出相對於上述特定之成對檢索詞而將檢索時刻之順序顛倒之倒序成對檢索詞出現之第2出現次數;以及記憶機構,其於藉由上述第1及第2出現次數算出機構而算出之第1出現次數與第2出現次數之大小關係滿足特定條件之情形時,將上述較早的檢索詞與較晚的檢索詞作為同義詞而記憶。
根據本發明,參照將用以特定使用檢索詞之使用者之使用者特定資訊與用以特定使用該檢索詞執行檢索處理之檢索時刻的檢索時刻特定資訊建立關聯而記憶該檢索詞之檢索詞記憶機構,自與同一使用者特定資訊建立關聯之檢索時刻之間隔為特定時間以內之檢索詞,生成按照檢索時刻之順序而使檢索時刻較早的檢索詞與較晚的檢索詞成對之成對檢索詞,算出於所生成之成對檢索詞中特定成對檢索詞出現之第1出現次數,算出相對於特定成對檢索詞而使檢索時刻之順序顛倒之倒序成對檢索詞出現之第2出現次數,於第1出現次數與第2出現次數之大小關係滿足特定條件之情形時,將較早的檢索詞與較晚的檢索詞作為同義詞而記憶,藉此可根據用於檢索之檢索詞而生成同義詞辭典。
以下,參照圖式,對本發明之實施形態進行說明。再者,以下所說明之實施形態係對於資訊處理系統應用本發明之情形時之實施形態。
[1.資訊處理系統之構成及功能概要]
首先,使用圖1對本發明之一實施形態之資訊處理系統之構成及概要功能進行說明。
圖1係表示本實施形態之資訊處理系統1之概要構成例之模式圖。
如圖1所示,資訊處理系統1包括:資訊處理伺服器(資訊處理裝置之一例)10,其構築同義詞資料庫;購物伺服器20,其為使用者所利用之購物網站運營而設置;及終端裝置30,其用以使用者檢索並購入購物網站之商品。
資訊處理伺服器10與購物伺服器20係藉由區域網路等而連接,且可相互地收發資料,且構成伺服器系統(資訊處理裝置之一例)5。而且,伺服器系統5與終端裝置30係藉由網路3而連接,且藉由通信協定(例如,TCP/IP)而可收發資料。再者,網路3係藉由例如網際網路、專用通信線路(例如CATV(Community Antenna Television,社區共用天線)線路)、移動通信(包含基地台等)、及閘道器等而構築。
又,資訊處理伺服器10係記錄使用者於終端裝置30進行之檢索的檢索查詢,並根據檢索查詢日誌(query log),生成同義詞資料庫。
[2.各伺服器之構成及功能]
(2.1資訊處理伺服器10之構成及功能)
其次,使用圖2至圖4,對資訊處理伺服器10之構成及功能進行說明。
圖2係表示資訊處理伺服器10之概要構成之一例之方塊圖。圖3係表示記憶於檢索查詢日誌資料庫之檢索查詢日誌之一例之模式圖。圖4係表示記憶於刪除用字符資料庫之刪除用字符之一例之模式圖。
如圖2所示,作為電腦而發揮功能之資訊處理伺服器10包括通信部11、記憶部12、輸入輸出介面部13、及系統控制部14。而且,系統控制部14與輸入輸出介面部13係經由系統匯流排15而連接。
通信部11係連接於網路3而控制與終端裝置30、資料檢索伺服器7等之通信狀態,進而,連接於區域網路而進行與區域網路上之購物伺服器20等其他伺服器之資料之收發。
記憶部12例如包含硬碟驅動器等,且記憶作業系統及伺服器程式等各種程式、或資料等。再者,各種程式例如既可自其他伺服器裝置等經由網路3而取得,亦可記錄於記錄媒體而經由驅動裝置讀入。
又,於記憶部12中,構築有:檢索查詢日誌資料庫(以下,設為「檢索查詢日誌DB」)12a,其按照接收自各使用者之終端裝置30發送之檢索查詢之接收時刻之順序而記憶;刪除用字符資料庫(以下,設為「刪除用字符DB」)12b,其記憶用以自檢索查詢之檢索詞中刪除特定字符之字符;成對檢索詞資料庫(以下,設為「成對檢索詞DB」)12c,其記憶使檢索詞成對之成對檢索詞;及同義詞資料庫(以下,設為「同義詞DB」)12d等,其記憶存在同義詞關係之檢索詞。
於檢索查詢日誌DB 12a(檢索詞記憶機構之一例)中,如圖3所示,將用以特定自哪一使用者之終端裝置30發送之檢索查詢之唯一使用者ID(Identification,識別)(用以特定使用者之使用者特定資訊之一例)與自終端裝置30接收檢索查詢之日期及時間(接收時刻)建立關聯而記憶檢索詞。此處,唯一使用者ID包含IP(Internet Protocol,網際網路協定)位址、使用者之性別之編碼、使用者之年齡之編碼、使用者所居住之都道府縣之編碼。接收時刻為用以特定使用檢索詞執行檢索處理之時刻即檢索時刻的檢索時刻特定資訊之一例。又,於自終端裝置30發送檢索查詢時,終端裝置30亦可發送附加有點擊檢索按鈕之時間之資訊之檢索查詢作為使用檢索詞執行檢索處理之時刻即檢索時刻。而且,資訊處理伺服器10亦可自檢索查詢中提取檢索時刻,且代替接收時刻而將該檢索時刻記憶於檢索查詢日誌DB 12a。
於刪除用字符DB 12b中,如圖4所示,記憶有如「☆」、「★」等符號之刪除用字符、或欲自「 」(空間)等檢索詞中刪除之字符等。又,刪除用字符亦可為長音符號(長音字符)「一」。
於成對檢索詞DB 12c中,記憶有按照檢索時刻之順序而使接收時刻之順序(檢索時刻之順序之一例)較早的檢索詞與較晚的檢索詞成對之成對檢索詞。
於同義詞DB 12d中,記憶有自檢索查詢日誌生成之存在同義詞關係之檢索詞。
其次,輸入輸出介面部13進行通信部11及記憶部12與系統控制部14之間之介面處理。
系統控制部14包含CPU(Central Processing Unit,中央處理單元)14a、ROM(Read Only Memory,唯讀記憶體)14b、RAM(Random Access Memory,隨機存取記憶體)14c等。
系統控制部14藉由CPU 14a讀出並執行記憶於ROM 14b或記憶部12之各種程式,而進行同義詞之記憶處理等。
(2.2購物伺服器20之構成及功能)
其次,使用圖5,對購物伺服器20之構成及功能進行說明。
圖5係表示購物伺服器20之概要構成之一例之方塊圖。
如圖5所示,購物伺服器20包括通信部21、記憶部22、輸入輸出介面部23、及系統控制部24,且系統控制部24與輸入輸出介面部23係經由系統匯流排25而連接。再者,購物伺服器20之構成及功能因與資訊處理伺服器10之構成及功能大致相同,故於資訊處理伺服器10之各構成或各功能中,以不同點為中心進行說明。
通信部21通過網路3或區域網路等而控制與終端裝置30或資訊處理伺服器10等之通信狀態等。
於記憶部22中,構築有商品資料庫(以下,設為「商品DB」)22a、或會員資料庫(以下,設為「會員DB」)22b等。
於商品DB 22a中,使作為用以識別商品之識別碼之商品ID建立關聯而記憶有商品名、種類、商品之圖像、規格、及商品介紹之摘要等商品資訊、或廣告資訊等。又,於商品DB 22a中,記憶有藉由HTML(hypertext markup language,超文本標示語言)、XML(Extensible Markup Language,可延伸性標示語言)等標示語言等而記述之商品網頁之文件等。
於會員DB 22b中,登錄有經會員登錄之使用者(購物網站之利用者)之使用者ID、名稱、性別、年齡、地址、電話號碼、郵件位址(mail address)、職業、興趣、購買經歷、使用者所關心之主題或類型等使用者資訊。又,於會員DB 22b中,登錄有使用者自終端裝置30登入購物網站時所需之使用者ID、登入ID、及密碼。此處,登入ID及密碼為用於登入處理(使用者之認證處理)之登入資訊。
系統控制部24包含CPU 24a、ROM 24b、RAM 24c等。而且,系統控制部24藉由CPU 24a讀出並執行記憶於ROM 24b或記憶部22之各種程式,而將使用者之商品購入處理、或商品之購買經歷記錄於每個使用者ID。
(2.3終端裝置30之構成及功能)
其次,使用圖6對終端裝置30之構成及功能進行說明。
圖6係表示終端裝置30之概要構成之一例之方塊圖。
如圖6所示,作為電腦而發揮功能之終端裝置30為例如個人電腦或便攜式無線電話或PDA(personal digital assistant,個人數位助理)等移動終端,且包括通信部31、記憶部32、顯示部33、操作部34、輸入輸出介面部35、及系統控制部36。而且,系統控制部36與輸入輸出介面部35係經由系統匯流排37而連接。
通信部31通過網路3而控制與資訊處理伺服器10等之通信。再者,於終端裝置30為便攜式無線電話之情形時,為連接於網路3之移動通信網,而通信部31具有無線通信功能。
記憶部32例如包含硬碟驅動器等,且記憶作業系統、Web瀏覽器程式等。
顯示部33例如包含液晶顯示元件或EL(Electro Luminescence,電致發光)元件等。於顯示部33中,顯示有自資訊處理伺服器10取得之網頁等。
操作部34例如包含鍵盤及鼠標等。使用者藉由操作部34而輸入應答。再者,於顯示部33為如觸控面板般之觸控開關方式之顯示面板之情形時,操作部34取得顯示部33之畫面被按壓之部位之位置資訊。
輸入輸出介面部35為通信部31及記憶部32與系統控制部36之介面。
系統控制部36例如包含CPU 36a、ROM 36b、及RAM 36c。系統控制部36讀出並執行CPU 36a記憶於ROM 36b、或RAM 36c、或記憶部32之各種程式。
[3.資訊處理系統之第1實施形態之動作]
其次,使用圖7至圖12對本發明之1實施形態之資訊處理系統1之動作進行說明。
圖7係表示資訊處理系統之第1實施形態之動作例之流程圖。圖8係表示具有方向性之成對檢索詞之一例之模式圖。圖9係表示記憶於成對檢索詞DB 12c之成對檢索查詢之一例之模式圖。圖10係表示記憶於同義詞資料庫之同義詞之一例之模式圖。圖11係表示記憶於同義詞資料庫之同義詞之一例之模式圖。圖12係表示對於檢索詞而顯示同義詞之一例之模式圖。
首先,使用者存取購物伺服器20,輸入使用者ID或登入ID並輸入密碼,登入購物網站。終端裝置30將使用者ID或登入ID及密碼發送至購物伺服器20。
其次,若使用者為於購物網站上搜尋商品而輸入檢索詞進行檢索,則終端裝置30將包含檢索詞之檢索查詢發送至購物伺服器20。購物伺服器20自終端裝置30接收檢索查詢。
購物伺服器20基於檢索詞,參照商品DB 22a,進行商品之檢索。此時,購物伺服器20將接收到之檢索查詢與該檢索查詢之封包中所含之IP位址連同使用者ID或登入ID一併發送至資訊處理伺服器10。
資訊處理伺服器10基於自購物伺服器20接收到之使用者ID或登入ID,參照購物伺服器20之會員DB 22b,取得使用者之性別、年齡、地址。然後,資訊處理伺服器10根據接收之IP位址與使用者之性別編碼、年齡編碼、地址之都道府縣之編碼,生成唯一使用者ID(用以特定使用檢索詞之使用者之使用者特定資訊之一例)。再者,為提高使用者之同一性,而亦可以登入時之使用者ID、登入ID來代替自IP位址與使用者之性別之編碼等生成之唯一使用者ID。進而,唯一使用者ID亦可組合IP位址與使用者ID或登入ID。又,於使用包含IP位址之唯一使用者ID之情形時,即便是同一個使用者自IP位址不同之提供者(provider)進行存取之情形時,於檢索查詢日誌DB 12a上仍作為不同之使用者處理。
資訊處理伺服器10將經由購物伺服器20而自各終端裝置30接收之檢索查詢與唯一使用者ID及接收時刻建立關聯而記憶於檢索查詢日誌DB 12a。資訊處理伺服器10按照取得檢索查詢之檢索時刻之順序而構築記憶有檢索詞之檢索查詢日誌DB 12a。再者,接收時刻為用以特定使用檢索詞執行檢索處理之時刻即檢索時刻的檢索時刻特定資訊之一例,且既可為資訊處理伺服器10自購物伺服器20接收檢索查詢之時間,亦可為購物伺服器20自終端裝置30接收檢索查詢之時間。
於檢索查詢之數量為特定數量以上之情形時,或於特定時間,資訊處理伺服器10開始向下述同義詞DB 12d之記憶之處理。
如圖6所示,資訊處理伺服器10提取與特定唯一使用者ID相關聯之檢索查詢(步驟S1)。具體而言,資訊處理伺服器10之系統控制部14特定1個唯一使用者ID,參照檢索查詢日誌DB 12a,提取與唯一使用者ID相關聯之檢索查詢作為與同一使用者特定資訊建立關聯之檢索詞之一例。如圖3所示,資訊處理伺服器10之系統控制部14例如提取A部分之檢索查詢。此時,去除唯一使用者ID不同之B部分。
其次,資訊處理伺服器10提取與接收時刻相關聯之檢索詞(步驟S2)。具體而言,資訊處理伺服器10之系統控制部14自與特定唯一使用者ID相關聯之提取之檢索詞中提取接收時刻(檢索時刻之一例)之間隔為特定時間以內之檢索詞彼此並進行群組化作為與檢索時刻特定資訊相關聯之檢索詞之一例。
如圖3所示,資訊處理伺服器10之系統控制部14例如根據A部分之檢索詞將接收時刻之間隔為60秒以內之群組A1與群組A2進行群組化。接收時刻之間隔為特定時間以內之檢索詞彼此因重新檢索之時間間隔不過分遠,故使用者對特定商品重新輸入檢索詞後進行檢索之可能性較高。
接著,資訊處理伺服器10自檢索詞中刪除特定字符串(步驟S3)。具體而言,資訊處理伺服器10之系統控制部14參照刪除用字符DB 12b,於檢索詞中存在特定字符之情形時,刪除特定字符,轉換成刪除特定字符之檢索詞作為對較早的檢索詞及較晚的檢索詞進行字符串處理之一例。例如,於檢索詞為「(電視)]」之情形時,刪除「]」,將檢索詞設為「」。該情形為於按Enter鍵時亦錯誤地按了「]」之情形。
如此般,資訊處理伺服器10作為對較早的檢索詞及較晚的檢索詞之字符串進行處理而生成成對檢索詞之成對檢索詞生成機構之一例發揮功能。又,資訊處理伺服器10作為參照預先記憶有用以自檢索詞中刪除特定字符之字符之刪除用字符記憶機構,進行自較早的檢索詞及較晚的檢索詞中刪除特定字符之字符串處理而生成成對檢索詞之成對檢索詞生成機構之一例發揮功能。
其次,資訊處理伺服器10生成並記憶成對檢索詞(步驟S4)。具體而言,資訊處理伺服器10之系統控制部14參照檢索查詢日誌DB 12a,自唯一使用者ID與對應於特定時間之群組化之檢索查詢中,生成按照檢索時刻之順序而使接收時刻之順序較早的檢索詞與較晚的檢索詞成對之成對檢索詞。而且,資訊處理伺服器10之系統控制部14將所生成之成對檢索詞記憶於成對檢索詞DB 12c。如此般,資訊處理伺服器10作為根據與同一使用者特定資訊建立關聯之檢索時刻之間隔為特定時間以內之檢索詞,生成按照檢索時刻之順序而使檢索時刻較早的檢索詞與較晚的檢索詞成對之成對檢索詞之成對檢索詞生成機構之一例發揮功能。
如圖8所示,相對於群組A1之檢索詞「TV」、「 」、「 32」、「 32黑」,生成具有檢索時刻之順序之方向性之成對檢索詞。若群組A1之檢索詞有n個,則成對檢索詞之數量成為組合之數nC2
再者,檢索詞「 32(吋)」與檢索詞「 32黑」中,存在共同之檢索詞「」與「32」。資訊處理伺服器10為不使本來之檢索詞消失,而例如亦可僅刪除作為共同之檢索詞中之1個之「32」,而生成成對檢索詞(「」→「黑」)作為檢索詞「」與檢索詞「黑」。又,如圖3所示,於檢索詞「」與檢索詞「TV 」之情形時,資訊處理伺服器10亦可已刪除共同之檢索詞「」,而生成成對檢索詞(「 」→「TV」)。又,檢索詞一般多數情況下如「實體(entity)屬性值屬性值...」般輸入,故如此例般,亦可留下複數個檢索詞中最初出現之「」。
如此般,資訊處理伺服器10作為根據與使用者特定資訊及檢索時刻特定資訊相關聯之檢索詞,生成按照檢索時刻之順序而使檢索時刻較早的檢索詞與較晚的檢索詞成對之成對檢索詞之成對檢索詞生成機構之一例發揮功能。又,資訊處理伺服器10作為根據已刪除特定字符的較早的檢索詞及較晚的檢索詞,生成上述成對檢索詞之成對檢索詞生成機構之一例發揮功能。又,資訊處理伺服器10於檢索詞為2個以上且較早的檢索詞與較晚的檢索詞之間具有共同之檢索詞之情形時,作為根據已刪除共同之檢索詞的較早的檢索詞及較晚的檢索詞,生成成對檢索詞之成對檢索詞生成機構之一例發揮功能。
接著,資訊處理伺服器10判定是否存在剩餘之唯一使用者ID(步驟S5)。具體而言,於存在下一特定之唯一使用者ID之情形時(步驟S5;YES),資訊處理伺服器10之系統控制部14返回步驟S1,藉由下一特定之唯一使用者ID而提取檢索詞。如圖3所示,資訊處理伺服器10之系統控制部14例如提取B部分之檢索詞。於不存在下一特定之唯一使用者ID之情形時(步驟S5;NO),資訊處理伺服器10之系統控制部14進行步驟S6之處理。於步驟S2中,B部分之檢索詞因接收時刻之間隔長於60秒,故無法群組化。又,C部分之檢索詞因於步驟S2中接收時刻之間隔為60秒以內,故被群組化。而且,於C部分之檢索詞中,已刪除共同之檢索詞「」,而生成成對檢索詞(「」→「TV」)。
如此般,如圖9所示,資訊處理伺服器10之系統控制部14構築成對檢索詞DB 12c。
接著,資訊處理伺服器10特定成對檢索詞(步驟S6)。具體而言,資訊處理伺服器10之系統控制部14參照所構築之成對檢索詞DB 12c,特定某一成對檢索詞(例如,「TV」→「」)。再者,於各群組之組合之數nC2之合計為特定以上之情形時,亦可進行步驟S6以下之處理。
接著,資訊處理伺服器10算出成對檢索詞之第1出現次數(步驟S7)。具體而言,資訊處理伺服器10之系統控制部14參照成對檢索詞DB 12c而算出成對檢索詞(例如,「TV」→「」)之第1出現次數。此處,出現次數係對應於存在於成對檢索詞DB 12c之所有成對檢索詞而算出。即,出現次數為對應於檢索出之所有使用者之檢索次數。
如此般,資訊處理伺服器10作為算出於所生成之成對檢索詞中特定成對檢索詞出現之第1出現次數之第1出現次數算出機構之一例發揮功能。
接著,資訊處理伺服器10算出接收時刻之順序顛倒之成對檢索詞之第2出現次數(步驟S8)。具體而言,資訊處理伺服器10之系統控制部14參照成對檢索詞DB 12c,算出接收時刻之順序顛倒之成對檢索詞(例如,「」→「TV」)之第2出現次數。
如此般,資訊處理伺服器10作為算出相對於特定成對檢索詞而使檢索時刻之順序顛倒之倒序成對檢索詞出現之第2出現次數之第2出現次數算出機構之一例發揮功能。
接著,資訊處理伺服器10判定第1出現次數與第2出現次數之大小關係是否滿足特定條件(步驟S9)。具體而言,資訊處理伺服器10之系統控制部14於算出之第1出現次數與第2出現次數之差為特定範圍內之情形時,判定第1出現次數與第2出現次數之大小關係是否滿足特定條件。
此處,當於成對檢索詞「」→「TV」之情形時與成對檢索詞「TV」→「」之情形時之出現次數相抗衡等出現次數之大小關係滿足特定條件之情形時,關於檢索之順序,雙方向性較高。即,自使用者整體來看,只要亦有如「」→「TV」般重新輸入檢索詞之情況,則亦有如「TV」→「」般重新輸入檢索詞之情況,故設為檢索詞「」與檢索詞「TV」存在同義詞關係。
另一方面,作為出現次數之大小關係不滿足特定條件之例,關於成對檢索詞「C」→「C++」,於檢索之順序顛倒之成對檢索詞「C++」→「C」之第2出現次數為零、或相對於成對檢索詞「C」→「C++」之第1出現次數而為極少之情形時,設為成對檢索詞「C」→「C++」無雙方向性。於該情形時,設為檢索詞「C」與檢索詞「C++」不存在同義詞關係。
再者,作為第1出現次數與第2出現次數之大小關係滿足特定條件之情形時之示例,亦可使某一成對檢索詞(A→B)之出現次數與接收時刻之順序顛倒之成對檢索詞(B→A)之出現次數之差、比、或其等之對數為特定範圍內。
接著,於出現次數之大小關係滿足特定條件之情形時(步驟S9;YES),資訊處理伺服器10將成對檢索詞作為同義詞而記憶(步驟S10)。具體而言,如圖10所示,資訊處理伺服器10之系統控制部14將出現次數之大小關係滿足特定條件之成對檢索詞彼此記憶於同義詞資料DB 12d。
又,將2個檢索詞連同與作為同義詞而記憶之2個檢索詞中之至少一個檢索詞存在同義詞之關係之檢索詞一併作為同義詞而記憶於同義詞資料庫。例如,於將檢索詞「TV」與檢索詞「TV」作為同義詞,先記憶於同義詞資料DB 12d,並將成對檢索詞「」→「TV」於步驟S9中記憶之情形時,如圖10所示,將檢索詞「TV」、檢索詞「」、及檢索詞「TV」作為同義詞而記憶於同義詞資料DB 12d。
如此般,資訊處理伺服器10作為於第1出現次數與第2出現次數之大小關係滿足特定條件之情形時,將上述較早的檢索詞與較晚的檢索詞作為同義詞而記憶之記憶機構之一例發揮功能。又,資訊處理伺服器10作為於算出之第1出現次數與第2出現次數之差為特定範圍內之情形時,將較早的檢索詞與較晚的檢索詞作為同義詞而記憶之記憶機構之一例發揮功能。又,資訊處理伺服器10作為參照同義詞資料庫,將2個檢索詞連同與作為同義詞而記憶之2個檢索詞中之至少一個檢索詞存在同義詞之關係之檢索詞一併作為同義詞而記憶之記憶機構之一例發揮功能。
接著,資訊處理伺服器10判定是否存在剩餘之成對檢索詞(步驟S11)。具體而言,資訊處理伺服器10之系統控制部14參照成對檢索詞DB 12c,判定是否存在下一特定之成對檢索詞。
接著,於存在剩餘之成對檢索詞之情形時(於存在下一特定之成對檢索詞之情形時)(步驟S11;YES),資訊處理伺服器10之系統控制部14返回步驟S6,特定下一成對檢索詞。
如圖10所示,於成對檢索詞「自動二輪」→「(腳踏車)」之情形時,資訊處理伺服器10之系統控制部14亦算出檢索之順序顛倒之成對檢索詞「」→「自動二輪」之第2出現次數,判定第1出現次數與第2出現次數之大小關係是否滿足特定條件,將檢索詞「自動二輪」及檢索詞「」記憶於同義詞資料DB 12d。
如圖11所示,於檢索詞為英語且成對檢索詞「TV」→「television」之情形時,資訊處理伺服器10之系統控制部14亦算出檢索之順序顛倒之成對檢索詞「television」→「TV」之第2出現次數,判定第1出現次數與第2出現次數之大小關係是否滿足特定條件,將檢索詞「TV」及檢索詞「television」記憶於同義詞資料DB 12d。
於不存在剩餘之成對檢索詞之情形時(步驟S11;NO),資訊處理伺服器10之系統控制部14結束同義詞記憶之處理。
購物伺服器20只要自終端裝置30接收檢索詞,參照所構築之同義詞資料DB 12d,且於接收之檢索詞中具有存在同義詞關係之檢索詞,則如圖12般,於商品檢索之網頁50上,顯示存在同義詞關係之檢索詞。
以上,根據本實施形態,參照將唯一使用者ID(用以特定使用檢索詞之使用者之使用者特定資訊之一例)與接收時刻(用以特定使用檢索詞執行檢索處理之時刻即檢索時刻的檢索時刻特定資訊之一例)建立關聯而記憶該檢索詞之檢索查詢日誌DB 12a(檢索詞記憶機構之一例),自與同一之唯一使用者ID建立關聯之接收時刻之間隔為特定時間以內之檢索詞,生成按照接收時刻之順序而將接收時刻較早的檢索詞與較晚的檢索詞成對之成對檢索詞,算出所生成之成對檢索詞中特定成對檢索詞出現之第1出現次數,並算出相對於特定成對檢索詞而將檢索時刻之順序顛倒之倒序成對檢索詞出現之第2出現次數,於第1出現次數與第2出現次數之大小關係滿足特定條件之情形時,將較早的檢索詞與較晚的檢索詞作為同義詞而記憶,藉此,可根據用於檢索之檢索詞而生成同義詞辭典。
資訊處理伺服器10因生成同義詞辭典,故可輔助同義詞辭典之生成,從而可減輕人的負擔。
又,如與同一使用者特定資訊建立關聯之檢索詞般,若為與使用者特定資訊具有關聯之檢索詞,則推測為同一使用者以某一主題檢索之可能性高,故同義詞辭典之精度提高。
又,如檢索時刻之間隔為特定時間以內之檢索詞般,若為與檢索時刻特定資訊具有關聯之檢索詞,則於大致相同之時間關於同一主題進行檢索之可能性高,故同義詞辭典之精度提高。
又,於藉由第1及2出現次數算出機構而算出之第1出現次數與第2出現次數之差為特定範圍內之情形時,於將較早的檢索詞與較晚的檢索詞作為同義詞而記憶之情形時,成對檢索詞之雙方向性變高,同義詞辭典之精度提高。
又,於對較早的檢索詞及較晚的檢索詞之字符串進行處理而生成成對檢索詞之情形時,例如亦可對已刪除特定字符之成對檢索詞進行計數,使得可收集之成對檢索詞之數量增加,第1及第2出現次數之算出變得更加準確,同義詞之精度進一步提高。又,於參照預先記憶有用以自檢索詞中刪除特定字符之字符之刪除用字符DB 12b,進行自上述較早的檢索詞及較晚的檢索詞中刪除特定字符之字符串處理,而生成成對檢索詞之情形時,藉由所刪除之字符串之檢索詞而生成檢索查詢之對,藉此亦可對已刪除特定字符之成對檢索詞進行計數,使得可收集之成對檢索詞之數量增加,第1及第2出現次數之算出變得更加準確,同義詞之精度進一步提高。
於檢索詞為2個以上且上述較早的檢索詞與較晚的檢索詞之間具有共同之檢索詞之情形時,於根據已刪除共同之檢索詞之較早的檢索詞及較晚的檢索詞而生成成對檢索詞之情形時,亦可刪除共同之檢索詞而對成對檢索詞進行計數,因而可收集之成對檢索詞之數量增加,從而第1及第2出現次數之算出變得更加準確,同義詞之精度進一步提高。
資訊處理伺服器10於參照同義詞資料DB 12d,將2個檢索詞連同與作為同義詞而記憶之2個檢索詞中之至少一個檢索詞存在同義詞之關係之檢索詞作為同義詞而記憶於同義詞資料DB 12d之情形時,對於3個以上之檢索詞,同義詞之範圍亦較廣,同義詞資料DB 12d之通用性增加。
再者,於步驟S3中,資訊處理伺服器10之系統控制部14亦可不刪除特定字符或共同字符,而於步驟S4中,直接生成成對檢索詞。於該情形時,資訊處理伺服器10之系統控制部14於步驟S7及步驟S8中,於算出出現次數時,資訊處理伺服器10參照刪除用字符DB 12b,除出現次數以外亦算出包含刪除用字符之檢索詞之成對檢索詞。
如此般,於參照預先記憶有用以自檢索詞中刪除特定字符之字符之刪除用字符DB 12b,算出特定成對檢索詞之出現次數與相對於該成對檢索詞包含上述特定字符之成對檢索詞之出現次數之和作為第1出現次數,並參照刪除用字符DB 12b,算出倒序成對檢索詞之出現次數與相對於該倒序成對檢索詞包含特定字符之倒序成對檢索詞之出現次數之和作為第2出現次數之情形時,刪除特定字符,亦可對成對檢索詞進行計數,因而可收集之成對檢索詞之數量增加,從而第1及第2出現次數之算出變得更加準確,同義詞之精度進一步提高。
又,於算出特定成對檢索詞之出現次數與相對於該成對檢索詞的較早的檢索詞與較晚的檢索詞附加有共同之字符的成對檢索詞之出現次數之和作為第1出現次數,並算出倒序成對檢索詞之出現次數與相對於該倒序成對檢索詞的較早的檢索詞與較晚的檢索詞附加有共同之字符的倒序成對檢索詞之出現次數之和作為第2出現次數之情形時,亦可刪除共同之檢索詞而對成對檢索詞進行計數,因而可收集之成對檢索詞之數量增加,從而第1及第2出現次數之算出變得更加準確,同義詞之精度進一步提高。
進而,亦可於步驟S3中,資訊處理伺服器10之系統控制部14不刪除特定字符或共同字符,於步驟S4中直接生成成對檢索詞,於步驟S7及步驟S8中,於算出出現次數時,資訊處理伺服器10不參照刪除用字符DB 12b地算出出現次數。於包含刪除用字符或共同字符之情形時,成為分別之成對檢索詞。
[4.資訊處理系統之第2實施形態之動作]
其次,使用圖式對資訊處理系統之第2實施形態之動作進行說明。
圖13係表示資訊處理系統1之第2實施形態之動作例之流程圖。
如圖13所示,資訊處理伺服器10根據檢索查詢日誌DB 12a取得2個檢索詞(步驟S20)。具體而言,資訊處理伺服器10之系統控制部14參照檢索查詢日誌DB 12a,提取接收時刻不同之2個檢索詞。例如,提取檢索詞「(heavy-metal,重金屬)」、及檢索詞「」。
如此般,資訊處理伺服器10作為參照檢索詞記憶機構而取得第1檢索詞及第2檢索詞之檢索詞取得機構之一例發揮功能。
其次,資訊處理伺服器10自各檢索詞中刪除特定字符串(步驟S21)。具體而言,資訊處理伺服器10之系統控制部14參照刪除用字符DB 12b,於檢索詞中存在特定字符之情形時,刪除特定字符作為對於第1檢索詞及第2檢索詞進行字符串處理之一例。自檢索詞「」中刪除特定字符「一」,成為檢索詞「」。檢索詞「 」因無特定字符,故原封不動。
如此般,資訊處理伺服器10作為對藉由檢索詞取得機構而取得之第1檢索詞及第2檢索詞之字符串進行處理,當於該字符串已被處理之第1檢索詞與第2檢索詞之間包含關係成立時,將第1檢索詞與第2檢索詞作為同義詞而記憶之記憶機構之一例發揮功能。又,資訊處理伺服器10作為參照預先記憶有用以自檢索詞中刪除特定字符之字符之刪除用字符記憶機構,對藉由檢索詞取得機構而取得之第1檢索詞及第2檢索詞進行刪除特定字符之字符串處理,當於已刪除該特定字符之第1檢索詞與第2檢索詞之間包含關係成立時,將第1檢索詞與第2檢索詞作為同義詞而記憶之記憶機構之一例發揮功能。
又,於檢索詞「 CD(compact disk,光碟)」、檢索詞「CD 」之情形時,資訊處理伺服器10刪除共同字符「CD」,設為檢索詞「 」、檢索詞「」。
其次,資訊處理伺服器10判定是否存在包含關係(步驟S22)。具體而言,資訊處理伺服器10之系統控制部14判定於經刪除特定字符之處理之檢索詞彼此包含關係是否成立。因檢索詞「」包含於檢索詞「」(字符串「」共同),故資訊處理伺服器10之系統控制部14判定成立包含關係。再者,於檢索詞「 」檢索詞相同之情形時亦設為存在包含關係。
於包含關係成立之情形時(步驟S22;YES),資訊處理伺服器10將2個檢索詞作為同義詞而記憶(步驟S23)。具體而言,若包含關係成立,則資訊處理伺服器10之系統控制部14將檢索詞彼此設為存在同義詞關係,並將檢索詞彼此如圖10所示,記憶於同義詞DB 12d。
如此般,資訊處理伺服器10作為參照刪除用字符記憶機構,當於刪除特定字符之第1檢索詞與第2檢索詞之間包含關係成立時,將第1檢索詞與第2檢索詞作為同義詞而記憶之記憶機構之一例發揮功能。
於包含關係不成立之情形時(步驟S22;NO),或於步驟S23之後,資訊處理伺服器10判定是否存在剩餘之檢索詞(步驟S24)。具體而言,資訊處理伺服器10之系統控制部14參照檢索查詢日誌DB 12a,判定是否存在尚未取得之組合之檢索詞。
於存在剩餘之檢索詞之情形時(步驟S24;YES),返回步驟S20,自檢索查詢日誌DB 12a取得2個檢索詞。
於不存在剩餘之檢索詞之情形時(步驟S24;NO),資訊處理伺服器10之系統控制部14結束同義詞記憶之處理。
再者,於檢索詞「(hit-and-run,擊跑配合戰術)」、檢索詞「」之情形時,於步驟S22中,因檢索詞「」與檢索詞「 」所共同之字符串「」與檢索詞「 」相同,故資訊處理伺服器10之系統控制部14判定檢索詞「」與檢索詞「」存在包含關係。
又,於檢索詞「富士山」、檢索詞「富士△」之情形時,資訊處理伺服器10之系統控制部14於步驟S21中,刪除字符「△」,設為檢索詞「富士山」、檢索詞「富士」。而且,於步驟S22中,因檢索詞「富士」與檢索詞「富士山」所共同之字符串「富士」與檢索詞「富士」相同,故資訊處理伺服器10之系統控制部14判定檢索詞「富士山」與檢索詞「富士△」存在包含關係。
又,於檢索詞「富☆士」、檢索詞「富.士」之情形時,資訊處理伺服器10之系統控制部14於步驟S21中,刪除字符「☆」與字符「.」,設為檢索詞「富士」、檢索詞「富士」。因該等檢索詞一致,故資訊處理伺服器10之系統控制部14判定存在包含關係。
再者,作為對於第1檢索詞及第2檢索詞進行字符串處理之一例,資訊處理伺服器10之系統控制部14亦可不參照刪除用字符DB 12b,判定第1檢索詞及第2檢索詞之字符串中之一致部分與不同部分,並刪除不同部分。例如,於檢索詞「富☆士」、檢索詞「富.士」之情形時,「富士」為一致部分,「☆」與「.」為不同部分。因此,刪除字符「☆」與字符「.」。
又,如圖11所示,於檢索詞「heavy-metal rock」、檢索詞「heavy metal」之情形時,於步驟S22中,因共同之字符串「heavy metal」與檢索詞「heavy metal」相等,故資訊處理伺服器10之系統控制部14判定檢索詞「heavy-metal rock」與檢索詞「heavy metal」存在包含關係。
又,於檢索詞「hit-and-run」、檢索詞「and-run」之情形時,於步驟S22中,因共同之字符串「and-run」與檢索詞「and-run」相等,故資訊處理伺服器10之系統控制部14判定檢索詞「hit-and-run」與檢索詞「and-run」存在包含關係。
又,於檢索詞「Mt.Fuji」、檢索詞「△Fuji」之情形時,資訊處理伺服器10之系統控制部14於步驟S21中,刪除字符「△」,設為檢索詞「Mt.Fuji」、檢索詞「Fuji」。
於檢索詞「Fu☆ji」、檢索詞「Fu.ji」之情形時,資訊處理伺服器10之系統控制部14於步驟S21中,刪除字符「☆」與字符「.」,設為檢索詞「Fuji」、檢索詞「Fuji」。因該等檢索詞一致,故資訊處理伺服器10之系統控制部14判定存在包含關係。
又,於檢索詞「」、檢索詞「.」之情形時,若資訊處理伺服器10之系統控制部14於步驟S21中,刪除「一」及「.」,則成為檢索詞「 」、檢索詞「」。檢索詞「」因包含於檢索詞「」,故判定檢索詞「」、檢索詞「.」存在包含關係。
又,於檢索詞「heavy-metal rock」、檢索詞「heavy-metal」之情形時,若資訊處理伺服器10之系統控制部14於步驟S21中,刪除「-」,則成為檢索詞「heavymetal rock」、檢索詞「heavymetal」。檢索詞「heavymetal」因包含於檢索詞「heavymetal rock」,故判定檢索詞「heavy-metal rock」與檢索詞「heavy-metal」存在包含關係。
以上,根據本實施形態,參照檢索查詢日誌DB 12a(檢索詞記憶機構之一例),取得第1檢索詞及第2檢索詞,對取得之第1檢索詞及第2檢索詞之字符串進行處理,當於處理該字符串之第1檢索詞與第2檢索詞之間包含關係成立時,將第1檢索詞與第2檢索詞作為同義詞而記憶,藉此可根據用於檢索之檢索詞生成同義詞辭典。
又,參照檢索查詢日誌DB 12a(檢索詞記憶機構之一例),取得第1檢索詞及第2檢索詞,參照預先記憶有用以自檢索詞中刪除特定字符之字符之刪除用字符DB 12b(刪除用字符記憶機構之一例),對於取得之第1檢索詞及第2檢索詞進行刪除特定字符之字符串處理,當於刪除特定字符之第1檢索詞與第2檢索詞之間包含關係成立時,將第1檢索詞與第2檢索詞作為同義詞而記憶,於該情形時,可根據用於檢索之檢索詞而生成同義詞辭典。又,可自第1檢索詞或第2檢索詞確實地刪除欲刪除之字符,從而判定包含關係時之精度變高。
又,資訊處理伺服器10因生成同義詞辭典,故可輔助同義詞辭典之生成,從而可減輕人之負擔。
因自檢索詞中刪除特定字符,故同義詞之精度進一步提高。
進而,可使第1實施形態及第2實施形態之動作配合,從而使資訊處理伺服器10構築廣範圍之具有同義詞之同義詞辭典。
於檢索詞為2個以上且第1檢索詞與第2檢索詞之間具有共同之檢索詞之情形時,相對於已刪除該共同之檢索詞之第1及第2檢索詞,當於刪除特定字符時之包含關係成立時,將已刪除共同之檢索詞之第1及第2檢索詞作為同義詞而記憶,藉此,亦可刪除共同之檢索詞而對成對檢索詞進行計數,因此可收集之成對檢索詞之數量增加,第1及第2出現次數之算出變得更加準確,同義詞之精度進一步提高。
再者,資訊處理伺服器10亦可按照取得之第1檢索詞及第2檢索詞之字符串之順序,進行將該第1及第2檢索詞之各字符進行比較之字符串處理,判定包含關係,於該包含關係成立時,將第1檢索詞與第2檢索詞作為同義詞而記憶。
例如,於檢索詞「」、檢索詞「. 」之情形時,比較字符串之最初之字符,因字符「」為共同故資訊處理伺服器10判定對應。其次,因第2個字符「」為共同故資訊處理伺服器10判定為對應。繼而,因第3個字符「」與字符「.」參照刪除用字符DB 12b而為存在於刪除用字符DB 12b之字符,故資訊處理伺服器10加以忽略或判定為相同之刪除用字符而設為存在對應。而且,判定第4個字符「」、第5個字符」」亦對應,因無相比較之字符,故資訊處理伺服器10判定檢索詞「 」與檢索詞「.」存在包含關係。另一方面,比較字符串,於所對應之字符不同之情形時,資訊處理伺服器10判定不存在包含關係。又,於相對於字符串之長度(亦可為第1檢索詞及第2檢索詞之字符串之長度之平均等),存在特定數以上所對應之字符之情形時,亦可判定存在包含關係。
如此般,資訊處理伺服器10按照取得之第1檢索詞及第2檢索詞之字符串之順序,進行將該第1及第2檢索詞之各字符進行比較之字符串處理,判定包含關係,於該包含關係成立時,將第1檢索詞與第2檢索詞作為同義詞而記憶,於該情形時,可省略刪除字符之步驟S21。又,可參照刪除用字符DB 12b,排除特定字符,從而判定包含關係時之精度變高。
進而,本發明並不限定於上述各實施形態。上述各實施形態為例示,具有與本發明之申請專利範圍之技術思想實質上相同之構成且發揮同樣之作用效果者不論為何者均包含於本發明之技術範圍內。
1‧‧‧資訊處理系統
3‧‧‧網路
5‧‧‧伺服器系統
10‧‧‧資訊處理伺服器(資訊處理裝置)
11‧‧‧通信部
12‧‧‧記憶部
12a‧‧‧檢索查詢日誌DB(檢索詞記憶機構)
12b‧‧‧刪除用字符DB
12c‧‧‧成對檢索詞DB
12d‧‧‧同義詞DB(同義詞資料庫)
13‧‧‧輸入輸出介面部
14‧‧‧系統控制部
14a‧‧‧CPU(中央處理單元)
14b‧‧‧ROM(唯讀記憶體)
14c‧‧‧RAM(隨機存取記憶體)
15‧‧‧系統匯流排
20‧‧‧購物伺服器
21‧‧‧通信部
22‧‧‧記憶部
22a‧‧‧商品DB
22b‧‧‧會員DB
23‧‧‧輸入輸出介面部
24‧‧‧系統控制部
24a‧‧‧CPU
24b‧‧‧ROM
24c‧‧‧RAM
25‧‧‧系統匯流排
30‧‧‧終端裝置
31‧‧‧通信部
32‧‧‧記憶部
33‧‧‧顯示部
34‧‧‧操作部
35‧‧‧輸入輸出介面部
36‧‧‧系統控制部
36a‧‧‧CPU
36b‧‧‧ROM
36c‧‧‧RAM
37‧‧‧系統匯流排
50‧‧‧商品檢索之網頁
圖1係表示本發明之實施形態之資訊處理系統之概要構成例之模式圖。
圖2係表示圖1之資訊處理伺服器之概要構成之一例之方塊圖。
圖3係表示記憶於圖2之檢索查詢日誌資料庫之檢索查詢日誌之一例之模式圖。
圖4係表示記憶於圖2之刪除用字符資料庫之刪除用字符之一例之模式圖。
圖5係表示圖1之購物伺服器之概要構成之一例之方塊圖。
圖6係表示圖1之使用者終端裝置之概要構成之一例之方塊圖。
圖7係表示圖1之資訊處理系統之第1實施形態之動作例之流程圖。
圖8係表示具有方向性之成對檢索查詢之一例之模式圖。
圖9係表示記憶於圖2之成對檢索查詢資料庫之成對檢索查詢之一例之模式圖。
圖10係表示記憶於圖2之同義詞資料庫之同義詞之一例之模式圖。
圖11係表示記憶於圖2之同義詞資料庫之同義詞之一例之模式圖。
圖12係表示對於檢索詞顯示同義詞之一例之模式圖。
圖13係表示圖1之資訊處理系統之第2實施形態之動作例之流程圖。
权利要求:
Claims (13)
[1] 一種資訊處理裝置,其特徵在於包括:成對檢索詞生成機構,其參照將用以特定使用檢索詞之使用者之使用者特定資訊、與用以特定使用該檢索詞執行檢索處理之時刻即檢索時刻的檢索時刻特定資訊建立關聯而記憶該檢索詞之檢索詞記憶機構,自與同一之上述使用者特定資訊建立關聯之上述檢索時刻之間隔為特定時間以內之檢索詞,生成按照上述檢索時刻之順序而將上述檢索時刻較早的檢索詞與較晚的檢索詞成對之成對檢索詞;第1出現次數算出機構,其算出於藉由上述成對檢索詞生成機構而生成之成對檢索詞中特定之成對檢索詞出現之第1出現次數;第2出現次數算出機構,其算出相對於上述特定之成對檢索詞而將檢索時刻之順序顛倒之倒序成對檢索詞出現之第2出現次數;以及記憶機構,其於藉由上述第1及第2出現次數算出機構而算出之第1出現次數與第2出現次數之大小關係滿足特定條件之情形時,將上述較早的檢索詞與較晚的檢索詞作為同義詞而記憶。
[2] 如請求項1之資訊處理裝置,其中上述記憶機構於藉由上述第1及第2出現次數算出機構而算出之第1出現次數與第2出現次數之差為特定範圍內之情形時,將上述較早的檢索詞與較晚的檢索詞作為同義詞而記憶。
[3] 如請求項1或2之資訊處理裝置,其中上述成對檢索詞生成機構對上述較早的檢索詞及較晚的檢索詞之字符串進行處理而生成上述成對檢索詞。
[4] 如請求項3之資訊處理裝置,其中上述成對檢索詞生成機構參照預先記憶有用以自上述檢索詞中刪除特定字符之字符之刪除用字符記憶機構,進行自上述較早的檢索詞及較晚的檢索詞中刪除特定字符之字符串處理而生成上述成對檢索詞。
[5] 如請求項1或2之資訊處理裝置,其中上述成對檢索詞生成機構於檢索詞為2個以上、且上述較早的檢索詞與較晚的檢索詞之間具有共同之檢索詞之情形時,自已刪除共同之檢索詞的較早的檢索詞及較晚的檢索詞而生成上述成對檢索詞。
[6] 如請求項1或2之資訊處理裝置,其中更包括參照上述檢索詞記憶機構而取得第1檢索詞及第2檢索詞之檢索詞取得機構;且上述記憶機構對藉由上述檢索詞取得機構而取得之第1檢索詞及第2檢索詞之字符串進行處理,當該字符串經處理之第1檢索詞與第2檢索詞之間成立包含關係時,將上述第1檢索詞與第2檢索詞作為同義詞而記憶。
[7] 如請求項6之資訊處理裝置,其中上述記憶機構按照藉由上述檢索詞取得機構而取得之第1檢索詞及第2檢索詞之字符串之順序,進行比較該第1及第2檢索詞之各字符之字符串處理而判定包含關係,於該包含關係成立時,將上述第1檢索詞與第2檢索詞作為同義詞而記憶。
[8] 如請求項6之資訊處理裝置,其中上述記憶機構參照預先記憶有用以自上述檢索詞中刪除特定字符之字符之刪除用字符記憶機構,對藉由上述檢索詞取得機構而取得之第1檢索詞及第2檢索詞進行刪除特定字符之字符串處理,當已刪除該特定字符之第1檢索詞與第2檢索詞之間成立包含關係時,將上述第1檢索詞與第2檢索詞作為同義詞而記憶。
[9] 如請求項6之資訊處理裝置,其中上述記憶機構於檢索詞為2個以上、且上述第1檢索詞與第2檢索詞之間具有共同之檢索詞之情形時,對於已刪除該共同之檢索詞之第1及第2檢索詞,當已刪除上述特定字符時之包含關係成立時,將已刪除上述共同之檢索詞之第1及第2檢索詞作為同義詞而記憶。
[10] 如請求項1或2之資訊處理裝置,其中上述記憶機構參照作為上述同義詞而記憶之檢索詞之同義詞資料庫,連同與作為同義詞而記憶之2個檢索詞中之至少一個檢索詞存在同義詞之關係之檢索詞將上述2個檢索詞作為同義詞而記憶。
[11] 一種資訊處理方法,其係進行資訊處理之資訊處理裝置之資訊處理方法,其特徵在於包含:成對檢索詞生成步驟,參照將用以特定使用檢索詞之使用者之使用者特定資訊、與用以特定使用該檢索詞執行檢索處理之時刻即檢索時刻的檢索時刻特定資訊建立關聯而記憶該檢索詞之檢索詞記憶機構,自與同一之上述使用者特定資訊建立關聯之上述檢索時刻之間隔為特定時間以內之檢索詞,生成按照上述檢索時刻之順序而將上述檢索時刻較早的檢索詞與較晚的檢索詞成對之成對檢索詞;第1出現次數算出步驟,算出於上述成對檢索詞生成步驟中生成之成對檢索詞中特定之成對檢索詞出現之第1出現次數;第2出現次數算出步驟,算出相對於上述特定之成對檢索詞而將檢索時刻之順序顛倒之倒序成對檢索詞出現之第2出現次數;以及記憶步驟,當上述第1及第2出現次數算出步驟中算出之第1出現次數與第2出現次數之大小關係滿足特定條件之情形時,將上述較早的檢索詞與較晚的檢索詞作為同義詞而記憶。
[12] 一種資訊處理裝置用程式產品,其特徵在於使電腦作為以下機構發揮功能:成對檢索詞生成機構,其參照將用以特定使用檢索詞之使用者之使用者特定資訊、與用以特定使用該檢索詞執行檢索處理之時刻即檢索時刻的檢索時刻特定資訊建立關聯而記憶該檢索詞之檢索詞記憶機構,自與同一之上述使用者特定資訊建立關聯之上述檢索時刻之間隔為特定時間以內之檢索詞,生成按照上述檢索時刻之順序而將上述檢索時刻較早的檢索詞與較晚的檢索詞成對之成對檢索詞;第1出現次數算出機構,其算出於藉由上述成對檢索詞生成機構而生成之成對檢索詞中特定之成對檢索詞出現之第1出現次數;第2出現次數算出機構,其算出相對於上述特定之成對檢索詞而將檢索時刻之順序顛倒之倒序成對檢索詞出現之第2出現次數;以及記憶機構,其於藉由上述第1及第2出現次數算出機構而算出之第1出現次數與第2出現次數之大小關係滿足特定條件之情形時,將上述較早的檢索詞與較晚的檢索詞作為同義詞而記憶。
[13] 一種電腦可讀取地記錄有資訊處理裝置用程式之記錄媒體,其特徵在於使電腦作為以下機構發揮功能:成對檢索詞生成機構,其參照將用以特定使用檢索詞之使用者之使用者特定資訊、與用以特定使用該檢索詞執行檢索處理之時刻即檢索時刻的檢索時刻特定資訊建立關聯而記憶該檢索詞之檢索詞記憶機構,自與同一之上述使用者特定資訊建立關聯之上述檢索時刻之間隔為特定時間以內之檢索詞,生成按照上述檢索時刻之順序而將上述檢索時刻較早的檢索詞與較晚的檢索詞成對之成對檢索詞;第1出現次數算出機構,其算出於藉由上述成對檢索詞生成機構而生成之成對檢索詞中特定之成對檢索詞出現之第1出現次數;第2出現次數算出機構,其算出相對於上述特定之成對檢索詞而將檢索時刻之順序顛倒之倒序成對檢索詞出現之第2出現次數;以及記憶機構,其於藉由上述第1及第2出現次數算出機構而算出之第1出現次數與第2出現次數之大小關係滿足特定條件之情形時,將上述較早的檢索詞與較晚的檢索詞作為同義詞而記憶。
类似技术:
公开号 | 公开日 | 专利标题
JP5170804B2|2013-03-27|関連語登録装置、情報処理装置、関連語登録方法、関連語登録装置用プログラム、および、記録媒体
US9690804B2|2017-06-27|Information processing device, information processing method, information processing program, and recording medium
CN103853722A|2014-06-11|一种基于检索串的关键词扩展方法、装置和系统
US10346414B2|2019-07-09|Information collection method and device
JP5068728B2|2012-11-07|関連ブログ提示装置、方法及びプログラム
US10402479B2|2019-09-03|Method, server, browser, and system for recommending text information
TWI529546B|2016-04-11|Information processing apparatus, information processing method and recording medium
EP2720156B1|2016-12-21|Information processing device, information processing method, program for information processing device, and recording medium
WO2012063772A1|2012-05-18|関連語登録装置、情報処理装置、関連語登録方法、関連語登録装置用プログラム、記録媒体、および、関連語登録システム
JP5185891B2|2013-04-17|コンテンツ提供装置、コンテンツ提供方法およびコンテンツ提供プログラム
KR20040074693A|2004-08-26|웹사이트 평가 시스템 및 그 방법
KR101499685B1|2015-03-09|키워드 트리 제공 방법
JP2012103924A|2012-05-31|関連語登録装置、関連語登録方法、関連語登録装置用プログラム、記録媒体、および、関連語登録システム
JP5231328B2|2013-07-10|広告情報提供装置
JP5777663B2|2015-09-09|検索支援装置及び検索支援プログラム
KR20070088193A|2007-08-29|주소창을 이용한 검색 방법
JP2008171110A|2008-07-24|サイト検索システム、検索サーバ、プログラム
CA2809315C|2014-03-11|Forming search query word pair thesaurus based on search time and count
JP2003141125A|2003-05-16|マルチメディア情報統合検索装置およびその方法
JP2012008971A|2012-01-12|検索情報表示装置、検索情報表示方法、検索情報表示プログラム、情報検索装置、情報検索プログラム、および、記録媒体
KR101509141B1|2015-04-06|검색결과 처리 방법
JP5921485B2|2016-05-24|コンテンツ通知装置、コンテンツ通知方法およびプログラム
KR20040096798A|2004-11-17|인터넷 및 네트워크를 이용하여 전자문서뷰어와지식관리서버를 연동하는 시스템 및 방법
同族专利:
公开号 | 公开日
KR20130070632A|2013-06-27|
JP5113936B1|2013-01-09|
TWI529546B|2016-04-11|
EP2618277B1|2014-11-12|
EP2618277A4|2014-02-12|
CN103370708A|2013-10-23|
EP2618277A1|2013-07-24|
US9418102B2|2016-08-16|
WO2013077039A1|2013-05-30|
JP2013109701A|2013-06-06|
BR112013004595B1|2020-12-08|
US20130173619A1|2013-07-04|
CN103370708B|2015-07-08|
BR112013004595A2|2016-08-16|
ES2530365T3|2015-03-02|
KR101339498B1|2013-12-10|
引用文献:
公开号 | 申请日 | 公开日 | 申请人 | 专利标题
US4736296A|1983-12-26|1988-04-05|Hitachi, Ltd.|Method and apparatus of intelligent guidance in natural language|
US5675819A|1994-06-16|1997-10-07|Xerox Corporation|Document information retrieval using global word co-occurrence patterns|
JPH09251939A|1996-03-18|1997-09-22|Toshiba Corp|電子ビーム描画装置の調整方法|
US5987460A|1996-07-05|1999-11-16|Hitachi, Ltd.|Document retrieval-assisting method and system for the same and document retrieval service using the same with document frequency and term frequency|
US6006225A|1998-06-15|1999-12-21|Amazon.Com|Refining search queries by the suggestion of correlated terms from prior searches|
US6144958A|1998-07-15|2000-11-07|Amazon.Com, Inc.|System and method for correcting spelling errors in search queries|
JP4082059B2|2002-03-29|2008-04-30|ソニー株式会社|情報処理装置および方法、記録媒体、並びにプログラム|
US6691103B1|2002-04-02|2004-02-10|Keith A. Wozny|Method for searching a database, search engine system for searching a database, and method of providing a key table for use by a search engine for a database|
JP2004126840A|2002-10-01|2004-04-22|Hitachi Ltd|文書検索方法、プログラムおよびシステム|
JP3677779B2|2003-04-04|2005-08-03|ソニー株式会社|情報処理装置および方法、プログラム、並びに記録媒体|
US7373102B2|2003-08-11|2008-05-13|Educational Testing Service|Cooccurrence and constructions|
JP2005141449A|2003-11-06|2005-06-02|Nippon Telegr & Teleph Corp <Ntt>|情報フィルタリング用プロファイル作成装置、情報フィルタリング用プロファイル作成方法および記録媒体|
JP2005250762A|2004-03-03|2005-09-15|Mitsubishi Electric Corp|辞書生成装置、辞書生成方法および辞書生成プログラム|
JP2005316699A|2004-04-28|2005-11-10|Hitachi Ltd|コンテンツ公開システム、コンテンツ公開方法、及びコンテンツ公開プログラム|
US7765178B1|2004-10-06|2010-07-27|Shopzilla, Inc.|Search ranking estimation|
JP2006141449A|2004-11-16|2006-06-08|Aruze Corp|遊技機|
JP2006316699A|2005-05-12|2006-11-24|Hitachi Ltd|車両の制御装置|
KR20070047544A|2005-11-02|2007-05-07|김정진|유사도를 적용하여 특허 문서를 검색하는 방법 및 그시스템|
US8489574B2|2006-06-12|2013-07-16|Zalag Corporation|Methods and apparatuses for searching content|
WO2008059515A2|2006-08-01|2008-05-22|Divyank Turakhia|A system and method of generating related words and word concepts|
US7552112B2|2006-09-18|2009-06-23|Yahoo! Inc.|Discovering associative intent queries from search web logs|
JP4240329B2|2006-09-21|2009-03-18|ソニー株式会社|情報処理装置および情報処理方法、並びにプログラム|
US7577643B2|2006-09-29|2009-08-18|Microsoft Corporation|Key phrase extraction from query logs|
JP2009003515A|2007-06-19|2009-01-08|Mitsubishi Electric Corp|情報検索装置|
JP2009025968A|2007-07-18|2009-02-05|Fujifilm Corp|関連語辞書作成装置、方法、及びプログラム、並びにコンテンツ検索装置|
JP2009042968A|2007-08-08|2009-02-26|Nec Corp|情報選別システム、情報選別方法及び情報選別用プログラム|
US8171029B2|2007-10-05|2012-05-01|Fujitsu Limited|Automatic generation of ontologies using word affinities|
US8290975B2|2008-03-12|2012-10-16|Microsoft Corporation|Graph-based keyword expansion|
JP2009258860A|2008-04-14|2009-11-05|Sony Corp|情報処理装置および方法、記録媒体、プログラム、並びに情報処理システム|
JP4640554B2|2008-08-26|2011-03-02|Necビッグローブ株式会社|サーバ装置、情報処理方法およびプログラム|
US20100169316A1|2008-12-30|2010-07-01|Yahoo! Inc.|Search query concept based recommendations|
US8250072B2|2009-03-06|2012-08-21|Dmitri Asonov|Detecting real word typos|
JP5514486B2|2009-08-03|2014-06-04|株式会社日立製作所|Webページの関連性抽出方法、装置、及びプログラム|
JP5610197B2|2010-05-25|2014-10-22|ソニー株式会社|検索装置、検索方法、及び、プログラム|
BR112012029059A2|2010-06-30|2016-08-09|Rakuten Inc|dispositivo e método de processamento de informação, e, meio de gravação|
US9235566B2|2011-03-30|2016-01-12|Thinkmap, Inc.|System and method for enhanced lookup in an online dictionary|
US9501759B2|2011-10-25|2016-11-22|Microsoft Technology Licensing, Llc|Search query and document-related data translation|JP5449466B2|2012-06-29|2014-03-19|楽天株式会社|情報処理システム、類似カテゴリ特定方法、およびプログラム|
CN103870461B|2012-12-10|2019-09-10|腾讯科技(深圳)有限公司|主题推荐方法、装置和服务器|
US20170116180A1|2015-10-23|2017-04-27|J. Edward Varallo|Document analysis system|
法律状态:
优先权:
申请号 | 申请日 | 专利标题
JP2011256055A|JP5113936B1|2011-11-24|2011-11-24|情報処理装置、情報処理方法、情報処理装置用プログラム、および、記録媒体|
[返回顶部]